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摘要 : 


[ 目的 】 分 析 我 国 地 方 政府 各 开放 数据 平台 接口 服务 同 国际 发 展 趋势 的 差距 ,探讨 提升 互 操作 性 的 途径 。 


【 应 用 背景 】“ 十 三 五 期间, 我 国 将 建设 国家 政府 数据 统一 开放 平台 , 推动 各 级 政府 数据 的 开放 共享 与 深度 利用 ， 
对 开放 数据 接口 服务 有 着 广泛 的 需求 。[ 方法 】 在 介绍 国际 上 主要 的 开放 数据 平台 和 W3C API 最 佳 实践 基础 上 ， 
分 析 我 国 开放 数据 平台 接口 服务 的 主要 不 足 。 引 进 开放 数据 协议 OData, 给 出 开放 标准 化 API 服务 的 关键 步 又 。 
[ 结果 】 通 过 搭建 OData 服务 、 发 布 说 明文 档 和 附加 机 器 可 读 的 元 数据 , 为 遵循 国际 通用 的 最 佳 实践 打下 基础 。 
【 结论 】 我 国 在 提供 接口 服务 时 , 需要 借鉴 先进 经 验 , 采纳 国际 标准 是 提升 互 操作 水 平 的 关键 。 

关键 词 : 开放 政府 数据 ”开放 数据 平台 API 接口 服务 OData 


分 类 号 : G203 


1 5l 


作为 一 种 基础 性 战略 资源 , 数据 被 誉 为 21 世纪 的 
“ 金 矿 ”。 各 国 纷纷 将 大 数据 提升 为 国家 发 展 战略 , TR 
极 推进 政府 数据 开放 和 大 数据 应 用 , 拉动 相关 产业 发 
展 趾 ,根据 世界 银行 的 统计 , 已 有 100 多 个 国家 和 超过 
250 个 政府 ， 及 联合 国 和 世界 银行 等 国际 组 织 ,， 实施 
“开放 数据 行动 计划 ”(Open Data Initiative)! 

纽约 州立 大 学 Albany 校区 政府 技术 研究 中 心 的 
学 者 分 析 了 “开放 政府 数据 ”(Open Government Data, 
OGD) 在 法 律 、 政 策 、 社 会 、 经 济 、 业 务 流程 和 技术 上 
面临 的 挑战 ,指出 应 着 重 从 三 个 方向 开展 研究 ， 即 理 
论 .政策 和 基础 设施 中 ,作为 关键 的 数据 基础 设施 (Data 
Infrastructures)， 开 放 数 据 平台 (Open Data Platform, 
ODP) 是 联系 数据 发 布 者 和 消费 者 的 枢纽 ， 成 为 “开放 
数据 行动 计划 ”重点 建设 的 对 象 (路, 到 2017 年 5 月 , F 
放 知 识 国 际 (Open Knowledge International) 的 网 站 
DataPortals.org 收集 的 数据 平台 门户 已 达 520 个 。 

为 开放 数据 资源 提供 “接口 服务 ” 即 应 用 程序 接 
口 (Application Programming Interface，APID 是 ODP 的 


m 


核心 功能 ,国际 上 呈现 出 标准 化 、 规 范 化 的 发 展 趋 势 ， 
日 益 成 为 消费 者 获取 数据 的 最 重要 方式 之 一 。 我 国学 
者 也 对 ODP 开展 了 人 研究， 吴 钢 等 外 认为 API 的 数量 体 
现 了 平台 数据 的 可 开发 程度 , 我 国 应 从 公众 需求 出 发 ， 
增加 API 的 数量 、 拓 宽 API 的 主题 领域 ; 黄 如 花 等 外 
认为 API 能 帮助 专业 用 户 实现 地 理 信息 相关 的 应 用 开 
发 ; 曹 雨 佳 @ 指 出 我 国 各 地 ODP 的 数据 存在 格式 混乱 
等 不 足 ; 钳 弘 阳 等 中 在 国内 外 比较 研究 的 基础 上 认为 
我 国 各 级 政府 网 站 API 的 开放 进程 仍 处 于 初始 阶段 。 
2015 年 9 月 5 日 , 国务 院 印发 《促进 大 数据 发 展 行 
动 纲要 》( 国 发 [2015 ] 50 =), 明确 在 2018 年 底 前 要 
建成 国家 政府 数据 统一 开放 平台 ; 2016 年 12 月 15 H, 
国务 院 印 发 《十 三 五 国家 信息 化 规划 》( 国 发 (2016 ] 
73 号 ), 推动 政府 数据 的 开放 共享 与 深度 利用 。 数 据 的 
再 利用 离 不 开 高 质量 的 API 服务 , 因此 研究 数据 平台 
开放 API 的 实现 方式 等 问题 具有 一 定 的 现实 意义 ， 而 
这 方面 国内 还 缺乏 可 操作 层面 的 较为 系统 的 研究 成 果 。 
本 文 从 W3C 开 放 数 据 API 的 最 佳 实践 人 手 , 分 析 
我 国 开放 数据 平台 API 服务 的 不 足 , 探讨 基于 国际 标 
准 OData 的 解决 方案 , 为 各 级 政府 的 开放 数据 实践 提 
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供 借 鉴 和 参考 。 
2 国内 外 发 展 状况 分 析 


2.1 国外 发 展 状况 
各 国 数据 门户 使 用 的 基础 平台 可 以 分 为 开源 的 


和 商业 目的 两 种 站。 表 1 列 出 6 个 代表 性 的 平台 。 其 中 ， 
CKAN(Comprehensive Knowledge Archive Network) 和 
DKAN(Drupalt+CKAN) 是 免费 的 开源 软件 (Open 
Source Software)， 而 Socrata 等 是 基于 云 服务 的 SaaS 
(Software-as-a-Service) 商 用 开放 数据 平台 。 


表 1 国际 上 主要 的 开放 数据 平台 


ES 网 址 ETT 应 用 实例 

CKAN https://ckan.org 开源 超过 146 个 应 用 实例 ， 如 美国 Data.Gov、 英 国 Data.Gov.UK 等 
http://getdkan.com/ 

DKAN https://www.drupal.org/project/dkan - 源 科隆 (德国 ) https://www.offenedaten-koeln.de 


http://docs.getdkan.com/en/stable 


芝加哥 data.cityofchicago.org 


t https: ta. B 
PUN pey /soctita gam | 日 金山 datasf.org/opendata 
Junar http://www.junar.com 前 用 智利 recursos.datos.gob.cl 
OpenDataSoft https://www.opendatasoft.com 商用 巴黎 opendata.paris.fr 
http://ogdi.codeplex. 
OGDI ib M M M ] 哥伦比亚 https://www.datos.gov.co/en 


https://github.com/openlab/OGDI-DataLab 


随 着 开放 数据 的 发 展 , W3C 于 2013 年 12 月 发 起 
新 的 数据 标准 行动 计划 (Data Activity), 致力 于 将 Web 
的 数据 互 操 作 (Data Interoperability) 能 力 推 向 一 个 新 的 
水 平 。 目 前, 该 标准 计划 包括 6 个 工作 组 , Web 数据 最 
住 实践 (Data on the Web Best Practices, DWBP) 工 作 组 
是 最 早 成 立 的 工作 组 之 一 , 其 任务 是 

(1) 开发 开放 数据 生态 系统 , 在 开发 者 和 数据 发 
布 者 之 间 建 立 更 好 的 交流 沟通 平台 ; 

(2) 为 数据 发 布 者 提供 指南 ， 指导 他 们 提升 数据 


管理 过 程 中 的 一 致 性 ， 以 提升 数据 的 可 重用 性 ; 

Q) 采用 各 种 技术 建立 开发 者 对 数据 的 信任 度 ， 
提升 数据 应 用 创新 的 巨大 空间 。 

DWBP 工作 组 在 对 各 国 开放 数据 实践 (包括 ODP) 
全 面 调 研 和 深入 分 析 基 础 上 , 在 元 数据 、 开 放 许 可 、 
溯源 、 数 据 质量 、 格 式 和 获取 等 方面 提炼 了 35 个 最 佳 
实践 (Best Practice, BP), 于 2017 年 1 H 31 日 发 布 为 
W3C 的 正式 推荐 标准 中 。 全 部 最 佳 实践 中 有 10 个 与 
API 密切 相关 ( 见 表 2), 足以 表明 API 的 重要 性 。 其 中 ， 


R2 W3C 推荐 的 API 最 佳 实践 


编号 最 佳 实践 说 明 
BP2 Provide Descriptive Metadata 为 API 提供 描述 元 数据 。 
" 一 六 可 读 的 标准 数据 格式 
BP12 Use Machine-readable Standardized Data Formats iu M ELAR n PEREMEES, 如 CSV, XML, JSON 和 
RE 
BP14 Provide Data in Multiple Formats 为 数据 资源 提供 多 种 格式 。 
BP18 Provide Subsets for Large Datasets 对 于 大 型 数据 集 ， 能 让 消费 者 获取 它 的 子 集 。 这 时 , API 是 最 灵活 的 方式 。 
BP20 Provide Real-time Access 通过 API 定期 轮 询 或 流 媒体 技术 , 让 消费 者 实时 获取 数据 。 
BP21 Provide Data up to Date 为 消费 者 提供 最 新 数据 ， 防 止 数据 过 时 。 
为 数据 资源 提供 BI DJ EB SE. zs r 功能 , 或 4 
BP23 Make Data Available through an API 为 数据 次 源 提 供 APL 可 以 傅 助 平台 (如 CKAN) 的 API 功能 ,或 者 API 的 
开发 框架 。 
£x 款 准 (主要 是 HTTP, 等 ) 之 上 ， 使 上 NET 
BP24 Use Web Standards as the Foundation of APIs Ell DeD E BATE REST SENS Is R 


BP25 Provide Complete Documentation for Your API 


BP26 Avoid Breaking Changes to Your API 


为 开发 者 提供 详细 的 API 说 明文 档 , 包括 每 个 API 的 目的 、 参 数 、 返 回 
值 和 使 用 示例 等 。 
避免 API 格式 与 文档 的 变化 , 使 客户 端 代码 保持 稳定 。 如 需 改 进 API， 最 
好 以 增 量 的 方式 并 采用 版 本 控制 。 
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BP23- BP26 是 专门 对 API 的 要 求 , BP14, BPI8, BP20 
和 BP21 是 通过 API 可 实现 的 高 级 需求 , 而 BP2 和 
BP12 则 是 共性 的 基本 要 求 。 

目前 , 主流 的 ODP 和 先进 国家 的 数据 门户 都 实现 了 
基本 的 API 最 佳 实践 (BP23-BP26、BP2 和 BP12 ^5)!?1 
2.0 ”国内 发 展 状 况 

从 2012 年 开始 , 我 国 已 相继 上 线 了 近 20 个 地 方 


政府 开放 数据 的 门户 网 站 中, 其 中 , 北京 、 上 海 、 浙 江 、 
贵州 、 广 东 、 贵 阳 、 广 州 、 深 圳 和 青岛 等 提供 了 “接口 
/API 服务 ” 哈尔滨 和 无 锡 等 尚 没有 API 服务 。 参照 表 
2 的 API 最 佳 实践 , 除去 三 个 难以 评价 的 (BP20、BP21 
和 BP26), 对 主要 开放 数据 平台 的 分 析 结 果 如 表 3 所 
m, 其 中 “优点 ”一 栏 列 出 实现 的 “最 佳 实践 ”, “不 足 ” 一 
栏 列 出 没 能 实现 的 “最 佳 实践 ”。 


表 3 我 国 地 方 政 府 开 放 数 据 平台 API 服务 的 分 析 结 最 佳 实践 的 视角 
地 方 政府 数据 门户 网 站 主要 优点 主要 不 足 
Sps DPI. BPS BP12( 元 数据 不 是 机 器 可 读 的 ); BP14(API 不 能 返 
北京 市 ”http://www.bjdata.gov.cn/ i S y T w、” 回 多 种 格式 , 只 是 JSON 格 式 ); BP18(API 没 有 查询 
ON API 提供 了 元 数据 和 说 明文 档 ) 功能 ); BP24 (不 是 RESTfulAPD; 调用 API 需 要 key 
BP2、BP18、BP23、BP25 BP12( 元 数据 不 是 机 兢 可 读 的 );， BPIA(API 不 能 返 
上 海 市 ”http://www.datashanghai.gov.cn/ (为 API 提供 了 元 数据 和 说 明文 档 ; 多 种 格式 , 只 是 XML 格式 ); BP24( 不 是 
API 有 查询 功能 ) RESTfulAPI) 
Gi. and BP12( 元 数据 不 是 机 器 可 读 的 ); BPIA(API 不 能 返 
贵州 省 —http://www.gzdata.gov.cn/ 为 API 提供 了 元 数据 回 多 种 格式 ， 只 是 XML 格式 ); BP18(API 没 有 查询 
D 功能 ); BP24 (不 是 RESTful API); BP25( 没 有 文档 ) 
BP2、BP18、BP23 BP12( 元 数据 不 是 机 器 可 读 的 ); BP14(API 不 能 返 
浙江 省  http://data.zjzwfw.gov.cn/ (为 API 提供 了 元 数据 ; API 有 查询 ” 回 多 种 格式 , 只 是 JSON 格式 ); BP24( 不 是 RESTful 
功能 ) API); BP25( 没 有 说 明文 档 ) 
BP2、BP23、BP24 BP12( 元 数据 不 是 机 器 可 读 的 ); BP14(API 不 能 返 
重庆 市 ”http://cqckan.chinacloudapp.cn/” (Jy API 提供 了 元 数据 ; 少量 数据 集 回 多 种 格式 , HE XML 格式 ); BP18(API 没 有 查询 
有 OData APT) 功能 ); BP25( 没 有 说 明文 档 ) 
BP2、BP18、BP23、BP25 BP12( 元 数据 不 是 机 器 可 读 的 ); BP14(API 不 能 返 
广东 省 http://www.gddata.gov.cn/ (为 API 提供 了 元 数据 和 说 明文 档 ; 回 多 种 格式 , 只 是 JSON 或 XML) BP24( 不 是 
API 有 查询 功能 RESTful APT) 
BP2, BPl4, BP18, BP23, BP25 
MN (为 API 提供 了 元 数据 和 说 明文 档 ; BP12( 元 数据 不 是 机 器 可 读 的 ); BP24( 不 是 
贵阳 市 ”http://www.gyopendata.gov.cn/ 


功能 


两 种 格式 JSON 和 XML; API 有 查询 RESTful API) 


可 见 ， 同 国际 发 展 趋势 一 致 , “API 服务 ”是 我 国 开 
放 数 据 平台 的 最 重要 功能 之 一 , 但 现 阶段 还 存在 如 下 
不 足 : 

(1) 各 地 采用 的 描述 数据 资源 API 的 元 数据 方案 
不 同 ， 且 元 数据 记录 格式 都 不 是 机 需 可 读 的 ; 

(2) 如 何 使 用 API 的 说 明文 档 不 规范 、 不 详尽 ， 
即使 同一 个 平台 内 各 API 的 文档 格式 也 不 统一 (北京 
除外 ); 

(3) API 缺失 查询 功能 或 查询 功能 不 全 面 , 用 户 难 
以 灵活 获取 部 分 数据 ; 

(4) 各 平台 API 的 实现 方式 、 采 用 的 技术 标准 不 
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一 致 ， 普 遍 不 是 RESTful API; 

(5 一 些 平台 调用 API 需要 key， 如 北京 、 深 圳 、 
青岛 等 , 而 浙江 、 重 庆 、 广 东 则 不 需要 key. 

这 些 不 足 破坏 了 平台 间 的 互 操 作 性 , 不 利于 各 数 
据 门户 聚合 到 国家 级 统一 平台 ,也 不 利于 应 用 程序 跨 
平台 获取 多 个 数据 资源 。 面 对 Web 的 开放 性 和 灵活 性 
给 数据 发 布 者 和 数据 消费 者 带 来 的 新 挑战 ，W3C 
DWBP 工作 组 的 建议 重点 是 向 消费 者 提供 REST 
(REpresentational State Transfer) 风格 的 API—— 
RESTful API, BJ BP24。 目 前 , 采用 开放 数据 协议 
OData 的 API 方案 则 是 最 佳 选择 之 一 。 


3 ”开放 数据 协议 OData 概述 


开放 数据 协议 OData(Open Data protocoD 是 建立 
在 HTTP, URIs, REST, JSON 和 AtomPub 等 Web 
标准 之 上 的 数据 获取 协议 (Data Access Protocol), 它 以 
标准 的 方式 创建 和 使 用 数据 API OData 的 最 初版 本 
由 微软 于 2007 年 提出 ,随后 微软 与 合作 伙伴 (IBM、SAP 
AG fill Red Hat 等) 一 起 将 其 提交 给 结构 化 信息 标准 促进 
组 织 (Organization for the Advancement of Structured 
Information Standards, OASIS), 于 2014 年 2 月 24 日 被 
批准 为 正式 标准 (3, 最 新 的 OData v4.0 又 于 2016 年 12 
月 15 日 成 为 ISO/EC 标准 QSO/EC 20802-1: 2016)! 
微软 的 很 多 产品 ， 如 SharePoint、Azure .WCF 和 OGDI 


等 ， 都 开始 支持 OData; 开放 数据 平台 Socrata 和 
OpenDataSoft 也 集成 了 OData 的 API 功能 0519。 随 着 
越 来 越 多 公司 的 加 入 和 产品 的 出 现 ，OData 的 生态 系 
统 正在 形成 , 在 开放 数据 领域 的 影响 也 日 益 显 现 C。 

OData 的 核心 标准 由 三 部 分 组 成 : 基础 协议 URL 
约定 和 通用 模式 定义 语言 , 如 表 4 所 示 。 两 个 附加 文 
档 分 别 定义 了 客户 端 与 服务 器 通信 的 JSON 格式 语法 ， 
及 数据 分 组 和 聚集 等 新 功能 "eH。OData 服务 (OData 
Service) 采 用 “实体 数据 模型 "(Entity Data Model, EDM) 
描述 数据 资源 , 模型 中 的 主要 概念 与 “关系 数据 模 
型 "(Relational Data Model, RDM) 的 映射 关系 如 表 5 所 
示 。OData 服务 暴露 出 的 API 中 可 以 包含 各 种 查询 关 
键 字 ( 见 表 6), 供 客户 端 灵 活 选 取 数 据 。 


表 4 OData 标准 的 组 成 


序号 名 称 说 明 
1 Part 1: Protocol Plus Errata 03 定义 协议 的 核心 语义 和 能 力 
2 Part2: URL Conventions Plus Errata 03 推荐 URL 的 构建 规则 , 用 以 标识 数据 和 元 数据 , 以 及 查询 字符 串 
3 Part3: Common Schema Definition Language(CSDL) Plus Errata 03 ”定义 OData 服务 的 “实体 数据 模型 "EDMD) 的 XML 表示 
4 OData JSON Format Version 4.0 Plus Errata 03 对 Part 1 的 补充 , 给 出 客户 端 与 服务 器 通信 的 JSON 格式 语法 
5  OData Extension for Data Aggregation Version 4.0 增加 分 组 和 聚集 功能 


表 5 EDM 与 RDM 的 概念 映射 


EDM RDM 说 明 
实体 集 (Entity Set) 表 或 视图 对 应 数据 库 中 的 表 , 也 称 集合 (Collections) 或 源 (Feeds) 
实体 (Entity) 数据 行 对 应 数据 库 表 中 的 一 行 数据 
操作 (Operation) 存储 过 程 对 数据 的 CRUD (Create, Retrieve, Update, Delete) 操 作 
导航 属性 (Navigation Property) 外 键 定义 实体 间 的 关系 
表 6  OData 查询 关键 字 
序号 查询 关键 字 说 明 

1 $select 等 价 于 T-SQL 的 SELECT FAJ, 用 于 确定 OData 服务 返回 哪些 列 

2 Sexpand 用 来 指定 相关 的 实体 ,以 内 联 形式 表示 ,类似 T-SQL 中 的 多 表 联 合 查询 

3 Sfilter 等 价 于 T-SQL 的 WHERE FAJ, 指定 查询 结果 应 满足 的 条 件 

4 $orderby 等 价 于 T-SQL 的 ORDER BY 子 句 ,用 于 对 查询 结果 排序 

5 $top 等 价 于 T-SQL 的 TOP 子 句 ,限制 返回 的 记录 个 数 

6 $skip 排除 给 定 参 数 N 的 记录 数 ， 从 第 N+1 个 记录 开始 返 芭 

7 $count 指定 true 值 , 返回 请 求 匹 配 集合 中 总 共 的 记录 个 数 

8 $search 返回 指定 查询 表达 式 限 制 的 实体 信息 


不 同 于 其 他 基于 REST 的 Web 服务 方法 , OData 
有 如 下 特点 中 

(1) 使 用 URIs 标识 资源 , 包括 OData 服务 、 实 体 
集 和 实体 等 。 

(2) 利用 HTTP 方法 执行 对 资源 的 操作 ,包括 


GET( 获 取 或 查询 资源 )、POST( 创 建新 资源 )、PUT( 更 
新 资源 )、PATCH( 更 新 资源 ) 和 DELETE( 删 除 资源 )。 

(3) 以 机 器 可 读 的 格式 表示 数据 和 数据 模型 。 在 
OData v4.0 中 , JSON 是 数据 表示 的 标准 格式 ， 同 时 通 
过 XML 表示 数据 模型 。 
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(4) 以 机 器 可 读 的 格式 提供 描述 文档 : 服务 文档 
(Service Document) 和 元 数据 文档 (Metadata Document). 
服务 文档 列 出 了 全 部 的 实体 集 、 函 数 和 单 例 , 用 户 可 以 
借助 服务 文档 导航 整个 模型 。 元 数据 文档 描述 了 每 个 实 
体 集 的 数据 模式 和 数据 类 型 等 , 帮助 用 户 理 解数 据 、 构 
建 查询 以 及 与 服务 器 的 交互 。 例 如 ,巴黎 开放 数据 平台 
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(参见 表 1) 的 这 两 个 文档 的 网 址 分 别 是 : https://opendata. 
paris.fr/api/odata( Ik 4 X^ F4), https://opendata.paris.fr/api/ 
odata/$metadata( 元 数据 文档 ), 它们 都 是 XML 格式 的 。 

因此 , OData 标准 提升 了 系统 之 间 的 互 操作 性 , 在 
开放 数据 的 API 上 有 着 简单 、 高 效 和 功能 完善 的 优势 ， 
如 表 7 所 示 。 


表 7 CKAN API、Socrata API 与 OData API 的 对 比 


平台 API 类 型 API 模式 

通过 键 值 对 的 方式 查询 与 查询 字符 串 匹 配 的 数据 资源 { 根 URL /api/[version]/action/resource search?query- 

CKAN API 的 元 数据 { 元 数据 字段 key): (value? 
某 一 数据 集 下 的 全 部 的 元 数据 描述 , 包括 该 数据 集 下 UR. URL V/api/(version)/action/package show?id- 
数据 资源 元 数据 (datasetName or datasetId} 

Socrata API — 某 一 数据 集 下 的 数据 资源 { 根 URL V/resource/(dataset identifier]. {datatype} 
获取 元 数据 文档 { 根 URL ]/$metadata 
获取 服务 文档 { 根 URLY/ 

OData API 获取 一 个 实体 集 { 根 URL)/fentityset identifier] 


查询 实体 集中 某 一 实体 
其 他 查询 API 


{ 根 URL/fentityset identifier}(entity id) 
{ 根 URL/fentityset identifier] ?Sfilter- (1 5 


4 基于 OData 的 API 服务 的 实现 方法 


API 服务 的 实现 方法 主要 有 两 种 : 依托 平台 (如 
CKAN 等 ) 提 供 的 API 服务 或 自行 设计 和 开发 。 目 前 ， 
我 国 各 开放 数据 网 站 大 多 没有 采用 国外 的 平台 软件 ， 
因此 本 节 介 绍 基于 OData 标准 的 实现 和 开放 API 服 
务 的 关键 步骤 。 


4.1 创建 OData 服务 

如 图 1 所 示 , OData 服务 是 开放 数据 平台 的 核心 组 
件 之 一 ， 它 负责 解析 用 户 的 OData API 请 求 , 然后 访 
问 数据 源 将 结果 返 给 用 户 。OData 是 Web 环境 中 的 
JDBC 和 ODBC, 但 其 数据 源 不 局 限于 关系 数据 库 ， 可 
以 是 非 SQL 数据 源 和 数据 文件 等 。 


数据 源 放 数 据 平台 (CKAN, Socrata, 其 他 类 型 ) 
关系 型 数据 库 - z 
Microsoft SQL Server 数据 服务 层 id 数据 消费 
MySQL 数据 查询 OData API 调 
dusk 服务 平台 交流 层 | A POR 
OQ ~ 
非 关 系 型 数据 库 B 讨论 区 - 
x = XML 
OG Po aura b 社交 媒体 Nox 
MongoDB DES 移动 端 
Couchbase Server | 
Apache HBase xe API RSS : 
ATA RSS 订 阅 3tAl 
文件 类 型 en 
JY 
Microsoft Excel... OData 服 务 
LI API Server 
Excel Add-Ins 第 三 方 提供 商 产 品 
OData Connectors 等 


图 1 开放 数据 平台 中 的 OData 服务 


EN 数据 分 析 与 知识 发 现 


在 创建 OData 服务 时 ， 或 者 选用 开源 的 支持 库 ， 
如 Java 环境 下 的 Apache Olingo，.NET 环境 下 的 
RESTier 等 , 表 8 列 出 了 代表 性 的 支持 库 及 其 主要 技术 
要 求 ; 或 者 依托 商用 软件 , 如 CData 公司 (http://www. 
cdata.com/) 的 软件 等 。 各 种 方式 的 实现 机 制 大 同 小 异 ， 
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即 首先 提供 OData 服务 的 元 数据 , 向 用 户 声明 哪些 请 
求 可 以 执行 、 返 回 结果 的 结构 以 及 如 何 导 航 服务 等 
然后 响应 用 户 请 求 ， REIS (Processor) AAAI, E 
据 元 数据 的 规定 匹配 变量 名 、 类 型 和 长 度 等 ,向 用 户 
返回 数据 。 


表 8 实现 OData 服务 的 代表 性 支持 库 的 主要 技术 要 求 


名 称 网 址 技术 平台 文 持 的 版 本 
Apache Olingo http://olingo.apache.org/ Java V2 fll VÀ 
RESTier http://odata.github.io/RES Tier/ .Net V4 
node-odata https://github.com/TossShinHwa/node-odata JavaScript V4 


ODataStore for CoreData (iOS) 


http://www.hwigmbh.de/hwi/produkte/odatastore-for-coredata/ Objective-C (iOS & Mac OS X) V3 


42 ”发布 说 明文 档 

启动 OData 服务 的 同时 , 应 发 布 说 明文 档 详细 描 
述 OData API 的 类 型 、 功 能 及 调用 方式 等 。 在 笔者 的 
实验 环境 中 ,借助 CData Software 提供 的 Excel 


OData Connectors, 将 浙江 省 开放 数据 网 站 (参见 表 3) 
教育 科技 大 类 下 的 “浙江 省 学 校 信息 ”数据 集 发 布 为 
OData API, API 示例 如 表 9 所 示 , 它们 应 是 说 明文 档 
的 核心 内 容 。 


表 9 基于 HTTP GET 方法 的 OData API 示例 


hem API 类 型 调用 方式 
1 全 部 数据 集 元 数据 GET localhost:8050/api.rsc/$metadata 
2 数据 集 服务 文档 GET localhost:8050/api.rsc/ 
3 查询 某 个 数据 集 GET localhost:8050/api.rsc/ 高 等 学 校 
4 查询 数据 集中 某 一 数据 项 GET localhost:8050/api.rsc/ 高 等 学 校 (1) 
5 根据 $search 传人 参数 值 进行 查询 GET localhost:8050/api.rsc/ 高 等 学 校 ?$search= 大 学 
6 根据 $filter 传人 参数 值 ， 限 制 返回 结果 集 GET localhost:8050/api.rsc/ 高 等 学 校 ?$filter=phone 
7 $count 返回 数据 集 记录 总 数 GET localhost:8050/api.rsc/ 高 等 学 校 /$count 
8 Sorderby 根据 字段 名 返回 结果 集 排序 ， 默认 升序 GET localhost:8050/api.rsc/ 高 等 学 校 ?$orderby schoolCode 


可 见 , 基于 HTTP GET 方 法 , OData 服务 提供 了 丰 
富 的 查询 APT, 供用 户 实时 在 线 读 取 需 要 的 数据 。 
4.3 ”附加 元 数据 

元 数据 帮助 用 户 发 现 、 理 解 和 使 用 APL 提高 数 
据 资源 的 可 发 现 性 和 可 用 性 。 

由 于 缺乏 通用 的 元 数据 标准 , 我 国 各 开放 数据 门 
户 在 描述 数据 资源 的 API 时 , 元 数据 项 的 个 数 与 名 称 
不 尽 相 同 ， 而 且 普 遍 没有 采用 机 器 可 读 的 元 数据 记录 
格式 ( 仅 是 HTML 网 页 )。 例 如 , 北京 是 “接口 地 址 ”“ 接 
口 参 数 "、“ 返 回 值 说 明 ” 和 “详细 使 用 说 明 ” 四 个 元 数据 
项 ， 上 海 的 元 数据 项 的 名 称 是 “接口 服务 地 址 *"、“ 参 数 
说 明 ”、“ 返 回 值 说 明 ”* 和 “接口 说 明文 档 ”， 广东 、 贵 州 
和 贵阳 多 了 “支持 格式 "、“ 请 求 方式 "和 “请 求 示 例 ” 等 


\ 


数据 项 ， 而 重庆 只 有 一 个 “OData endpoint kha 

世界 各 国 以 W3C 正式 推荐 标准 DCAT(Data 
Catalog Vocabulary) 为 基础 ， 开 发 了 各 自 的 元 数据 标准 
MW, 如 美国 、 英 国 、 澳 大 利 亚 、 爱 尔 兰 和 欧盟 等 。 
笔者 的 前 期 研究 也 设计 了 基于 DCAT 的 我 国 地 方 政 府 
核心 元 数据 方案 所 。 在 DCAT 中 ，dcat:accessURL 元 
数据 项 是 专门 用 于 API 的 , 并 支持 JSON, XML 等 机 
器 可 读 的 编码 格式 。 以 北京 开放 数据 门户 (参见 表 3) 
为 例 , 数据 集 “ 高 校 ” 的 JSON 格式 的 API 元 数据 记录 
如 下 (省 略 了 其 他 元 数据 ): 

"distribution": [ 

("title": TR ; 

"description": "该 数据 是 北京 市 教育 委 
校 信息 ， 包 括 名 称 ， 地 址 ， 学 校 类 别 等 B 
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"accessURL'": " http;//www.bjdata.gov.cn/api/3K 4-4 4& API 接口 
使 用 说 明 书 (文件 类 ).pdf"， 
"format": "API"}] 


其 中 , format 的 值 为 APLI 表示 数据 的 获取 方式 为 
API， 而 不 是 直接 下 载 ; accessURL 的 值 为 API 说 明文 
档 的 URL, 其 中 含有 请 求 方式 、 接 口 地 址 、 接 口 参数 
和 返回 值 的 详细 说 明 。 

显然 , 如 果 各 数据 平台 都 以 这 种 格式 提供 API 元 
数据 ,应 用 程序 就 能 以 一 致 的 方式 跨 平 台 读 取 和 解析 
它们 , 有 利于 大 量 数据 资源 的 自动 获取 , 最终 提高 数 
据 聚 合 和 分 析 的 效率 。 

这 样 , 通过 采用 OData 标准 ,为 遵循 BP12 .BP14、 
BP18、BP24 和 BP25 等 最 佳 实践 打下 了 和 良好 基础 ， 


5 结 语 


开放 数据 的 最 主要 目标 是 让 任何 人 以 最 便利 的 方 
式 获取 和 使 用 数据 。 目 前 , 通过 Web 获取 数据 的 方式 
有 两 种 : 批量 下 载 和 API, 它们 是 优势 互补 的 。 批量 下 
载 方式 简单 , 但 难以 适应 超大 的 数据 文件 和 实时 读 取 
数据 。API 适用 于 所 有 数据 ,特别 对 实时 数据 的 自动 
化 读 取 优势 明显 ,但 同 批量 下 载 相 比 ,发布 者 要 为 API 
做 出 更 多 的 工作 : 搭建 API 服务 、 撰 写 文 档 和 保持 API 
的 稳定 持久 等 。 

本 文 从 国际 上 最 佳 实践 的 视角 分 析 了 我 国 各 开放 
数据 平台 API 服务 的 主要 不 足 ， 进 而 探讨 了 基于 
OData 标准 的 接口 服务 的 实现 方法 。 结 果 表 明 , 我 国 
在 提供 接口 服务 时 , 需要 借鉴 先进 经 验 , 采纳 国际 标 
准 是 提升 API 服务 质量 的 关键 。 

未 来 的 工作 是 研究 特定 领域 (如 GIS 、 交 通 等 ) 的 专 
门 API 服务 和 实时 数据 的 API 服务 。 
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Abstract: [Objective] This paper aims to find out the differences between the interface services of governmental open 
data platform in China and developing trends around the world. [Context] During the 13th Five-Year Plan period, 
China will build a national open data platform to promote the sharing and in-depth utilization of data at all levels, which 
demands huge amount of interface services. [Methods] We analyzed the major issues facing the open data platform 
interface services in China, based on the popular international open data platforms and the W3C API best practices. We 
also introduced the open data protocol OData to discuss key steps for launching standardized API services. [Results] 
Building OData services, issuing documentation and machine-readable metadata could help our API services follow 
best practices. [Conclusions] Adopting internationally accepted standards could improve user experience of interface 
services in China. 

Keywords: Open Government Data Open Data Platform Application Programming Interface (API) Interface Service 
Open Data Protocol (OData) 


Data Analysis and Knowledge Discovery 


